这家亚马逊、Google、三星、华为背后的方案商,为我们展示了三款最新的语音方案
- shenzhenware -
三星 S9 还未上市,便已经提前在手机界掀起了一阵阵波澜,人们对其人脸识别开锁+语音控制等问题充满了好奇。而作为最早与三星合作开发消费电子语音方案商 Sensory,也在顺势兜售了一把自家的语音方案。
在不久前的 CES 2018 展会上,美国语音方案公司 Sensory 携带旗下三款核心语音方案——TrulyHandsfree、TrulyNaural 与 TrulySecure 参展,并基于这三种技术展示了数十种新产品和解决方案,合作方包括我们耳熟能详的 Amazon、Google、三星、LG、霍尼韦尔、摩托罗拉、英伟达、华为、中兴 、Anki 等知名品牌。
TrulyHandfree 语音识别技术:支持低功耗状态随时语音唤醒
TrulyHandfree 是一款嵌入式小型语音用户界面平台,植入了 Sensory 的语音识别技术。
据官方介绍,TrulyHandfree 有两个核心优势:一是高语音识别率,在高噪声环境下也能保持 95% 以上的语音识别准确率;二是低功耗运行,该方案能在电池电量不足 2mA 的情况下依然能够完全运行。
目前该平台已经与三星、索尼、华为、Google、LG 、Intel、CEVA 等终端品牌及方案商建立了合作,可应用在智能手机、蓝牙设备、汽车电子等消费电子产品上。经过多次的版本迭代,最新版本的 TrulyHandfree 具备以下几方面的优势:
植入了深度学习模型,具备更高的识别搜索准确度;
具备克服混响和恶劣声学环境的新算法;
高级滤波器组功能,可改善前端语音特征提取;
与 TrulyNatural 完全兼容,实现从 TrulyHandsfree 到 TrulyNatural 处理器的无缝切换。
TrulyHandfree 目前与一些世界一流大厂建立了稳固的合作关系,以三星为例:自 2014 年 9 月起 ,Sensory 便成为三星嵌入式语音识别技术的主要供应商,其中 TrulyHandfree 技术被用作 S-Voice 语音触发器(后来演变为三星自研的 Bixby 语音助手),还被植入 Galaxy S/Note 系列旗舰手机、三星 Gear 系列智能手表及一些支持 S-Voice 功能的相机与平板中。
▵ 早期三星 Galaxy 手机 S-Voice 语音助手操作界面
2016 年三月 ,Sensory 还与英特尔达成合作协议,来为 Intel 的部分芯片提供语音识别功能,除了消费级电子产品 ,TrulyHandsfree 还被广泛应用在车载 、IC 卡、智能耳机、家用电器、银行、医疗等多场景领域。
TrulyNaural:嵌入式百万词汇量的自然语言识别系统
TrulyNatural 是一个具备大词汇量连续语音识别能力的嵌入式 NLP 语音引擎,其使用特定形式的深度学习算法建造小型的声学神经网络模型,这些模型能根据用户的语音特征进行关键信息提取,并结合 Sensory 百万量级的词汇库进行精准搜索,提供给用户自然流畅的语音体验。
▵ TrulyNaural 任务处理流程架构
TrulyNaural 主要包含以下几方面特点:
可拓展性强:包含一个微型 FST 传感器和一个小于 1MB 内存的嵌入式识别器模块,其存储容量最大可拓展至 1000MB;
能提供精准、灵活、快速的语音检索:百万容量关键词检索,能将检索错误率降低至 8%;
与现有通用标准与工具兼容:能与 OpenFST、Kaldi 等开源语言模型工具兼容,也可与 ATT FSM 等通用标准兼容。
适用于多种语言:目前可支持英语、中文、韩语、法语、意大利语、葡萄牙语、西班牙语和俄语。
TrulyNaural 适合应用在汽车、物联网、移动电子等场景,其能与 TrulyHandsfree 完全兼容,能在 Sensory 语音识别技术基础上为消费端提供更灵活、快速、精准的语义理解及搜索能力。
Truly Secure:可应用在 PC、手机、耳机的生物识别技术
生物识别就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段,利用人体固有的生理特征(如指纹、人脸、虹膜、掌纹),及行为特征如(笔迹、声纹、步态等)来进行个人身份的鉴定。
早在 2012 年 ,Sensory 就曾推出了针对智能手机的声纹识别技术,并在 2014 年推出了高精度生物识别方案—— TrulySecure,该技术能摆脱繁琐的指纹和 PIN 码识别,通过声纹识别+人脸识别的技术结合提供身份识别方案。
https://v.qq.com/txp/iframe/player.html?vid=e0541f168xz&width=500&height=375&auto=0
TrulySecure 只需要一款 App,几乎适用于任何麦克风与相机。但相较于苹果 FaceID 依靠 3D 深度摄像机,在用户面部投射 3 万个红外光点以识别人类面部细节相比,其安全性相对较弱,因而目前尚未在支付上获得商用。
2016 年 ,Sensory 开始与三星 IT 部门 SamsungSDS 合作,共同开发基于移动支付场景的生物识别支付软件,通过使用手机的前置摄像头和声控完成识别认证。目前这一方案已经应用到了部分三星、LG、及摩托罗拉的 Moto X 系列手机上。
在 AI 技术大行其道的今天,类似 Sensory 这样的语音方案公司也在顺势而为,在这新一轮的技术红利中获得了开拓领土的机会 。Sensory 首席执行官 Todd Mozer 曾在采访中说道:
「今天,从手机、可穿戴设备到客厅厨房的大型不同形式的感官 AI 技术均可以在从超紧凑可穿戴设备到大型厨房设备的产品中找到。」而 Sensory 的成功要归功于公司「与芯片制造商 ,IP 提供商和操作系统(包括 iOS、Android 及 Linux)等合作伙伴建立了牢固的关系」。
关于 Sensory:Sensory 成立于 1994 年,是世界上最早从事语音合成芯片研究,并将音频技术应用到 PC 机和消费电子产品中的公司之一 。Sensory 拥有超过 35 项发明专利,涵盖消费电子领域的语音识别,生物认证,传感器/语音组合,唤醒词技术 ,DSP 语音识别,客户端/云端语音技术等等。■
主笔:谈哲 / 深圳湾
编辑:小琳 / 深圳湾
延展阅读
< 招兵买马 >
深圳湾招人啦!!!深圳湾正在招聘「真知灼见的科技记者」、「四通八达的运营编辑」、「才华横溢的市场策划」、「技能爆表的活动运营」、「热情四射的社区达人」,如果你对科技领域有满满的热情、想把玩最新最酷的科技产品、喜欢分享一切有趣科技成果,那就快到「湾」里来吧!
简历传输门👉 s@shenzhenware.com
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。